ACL Findings 2022 | THE-X: 通过同态加密实现Transformer的推断隐私安全
以下文章来源于ACTBIGDATA,作者陈天宇。
本次分享一篇关于同态加密应用于深度学习的文章。作者提出了THE-X,一种能够使预训练模型在同态加密环境下进行推断的解决方案。通过将Transformer模型当中的部分非线性组件替换为线性组件,THE-X可以使预训练模型完全享受到同态加密的优势,而且只有轻微的性能下降。THE-X是通过同态加密来解决预训练模型隐私问题的探索性质工作。我们希望这篇工作能够启发未来更好的大模型同态加密解决方案。
论文链接:
https://aclanthology.org/2022.findings-acl.277/
背景与挑战
方法
图1 使用THE-X进行云端大模型推断
图2 THE-X的拟合流程
为了替代模型中非线性操作,THE-X将fine-tune的过程分成以下几个阶段:
1. 对于一个预训练的模型,首先将剪裁掉预训练模型中的pooler,并且替换掉模型中的softmax和GELU算子。
2. 之后,THE-X会采用标准的分类和回归任务的finetune流程。THE-X会在fine-tune结束的模型中插入LayerNorm的线性替代,并且通过原本的LN Layer来蒸馏这些线性替代层。
实验结果
THE-X在GLUE数据集和SQuAD2.0数据集上分别进行了sentence-level和token-level的测试,实验结果表明使用THE-X进行算子估计,最多只会使得模型表现下降1.48%,从而可以应用在大量不同的NLP下游任务中。
图3 THE-X在多种不同任务上的结果
陈天宇 :北京航空航天大学计算机学院、大数据科学与脑机智能高精尖创新中心学生。研究兴趣包括:预训练方法与理论、深度学习模型安全、跨模态学习。邮箱:tianyuc@buaa.edu.cn